تبدیل گفتار بر پایه تحلیل مولفه های مستقل غیر خطی با به کارگیری گفتارهای همزمان شده

پایان نامه
  • وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی امیرکبیر(پلی تکنیک تهران) - دانشکده مهندسی
  • نویسنده شقایق رضا
  • استاد راهنما علی سید صالحی
  • تعداد صفحات: ۱۵ صفحه ی اول
  • سال انتشار 1387
چکیده

تبدیل گفتار از جمله شاخه های جدید تحقیقات گفتاری است. هدف سامانه های تبدیل گفتار تغییر سیگنال گفتار گوینده ی مرجع است به نحوی که خروجی آن همانند گفتار فرد هدف به نظر برسد. روش-های مختلفی از جمله نگاشت کدبوک ها، روش های آماری و ... در این زمینه ارایه شده است، اما کیفیت صوت تولیدی از این سامانه ها هنوز کاملا مطلوب نیست. در این پروژه برای تبدیل گفتار، سیگنال گفتار یک گوینده (گوینده ی مرجع) به دو دسته اطلاعات "پیام گفتار" و "هویت گوینده" تجزیه شده و سپس با تغییر هویت گوینده ی مرجع به هویت فردی دیگر (گوینده ی هدف) و ترکیب آن با اطلاعات پیام گفتار، صوت فرد هدف بازسازی می شود. به این منظور روش جدیدی بر پایه ی شبکه های عصبی برای جداسازی اطلاعات غیر خطی هویت گوینده از سیگنال گفتار پیشنهاد شده است. فرض مطرح در این روش مستقل بودن هویت گوینده از پیام گفتار و تلاش برای جداسازی این دو دسته اطلاعات است. مقادیر لگاریتم مجذور بانک فیلترها در مقیاس بارک (lhcb) از سیگنال گفتار گویندگان به عنوان بردار ویژگی استخراج شده و برای تعلیم شبکه ها مورد استفاده قرار می گیرد. وزن های شبکه به نحوی تعلیم می بیند که فضای ویژگی گوینده ی مرجع را به فضای ویژگی گوینده ی هدف نگاشت کند. ویژگی های دو گوینده مرجع و هدف برای تعلیم به این شبکه باید از آواهای متناظر دو گوینده و به بیان دیگر از سیگنال گفتارهای همزمان شده ی دو گوینده باشند. از این رو در این پروژه از روشی بر پایه ی الگوریتم ژنتیک برای همزمان سازی فریم های سیگنال گفتار گویندگان استفاده شده است. ارزیابی شنیداری نشان می دهد که گفتار خروجی شبکه تا حدودی به گفتار گوینده ی هدف شبیه شده است. کارآیی سامانه حاصله همچنین توسط روش های عددی و مقایسه ی دو فضای ویژگی ارزیابی شده است.

۱۵ صفحه ی اول

برای دانلود 15 صفحه اول باید عضویت طلایی داشته باشید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

استخراج مولفه های مستقل غیر خطی سیگنال گفتار

مطالعات بر روی نحوه ادراک گفتار انسان نشان می دهد که مغز انسان به وقایع خاصی در سیگنال گفتار حساسیت بیشتری نشان می دهد و این نواحی حاوی اطلاعات متمایزکننده مفیدی برای واحدهای صوتی پایه است. ماهیت این وقایع بعنوان واحدهای پایه واقعی حاوی اطلاعات غنی و مهم گفتار، از نظر زبان شناسی و مهندسی در دست بررسی است. از سوی دیگر در بررسی جنبه های زیستی ادراک گفتار توسط مغز انسان دیدگاههایی وجود دارد که ن...

15 صفحه اول

مقایسه تأثیر وضعیت طاق باز و دمر بر وضعیت تنفسی نوزادان نارس مبتلا به سندرم دیسترس تنفسی حاد تحت درمان با پروتکل Insure

کچ ی هد پ ی ش مز ی هن ه و فد : ساسا د مردنس رد نامرد ي سفنت سرتس ي ظنت نادازون داح ي سکا لدابت م ي و نژ د ي سکا ي د هدوب نبرک تسا طسوت هک کبس اـه ي ناـمرد ي فلتخم ي هلمجزا لکتورپ INSURE ماجنا م ي دوش ا اذل . ي هعلاطم ن فدهاب اقم ي هس عضو ي ت اه ي ندب ي عضو رب رمد و زاب قاط ي سفنت ت ي هـب لاتـبم سراـن نادازون ردنس د م ي سفنت سرتس ي لکتورپ اب نامرد تحت داح INSURE ماجنا درگ ...

متن کامل

به کارگیری آمار غیر خطی (آنالیز مولفه اصلی ) در آنالیز داده های تمایز سلول بنیادی به آستروسیت

سابقه و هدف : ترکیب آمار تک متغیره و چند متغیره می تواند به شناسایی تغییرات بیولوژیکی واقعی معنی دار در بیان پروتئین ها بین گروههای آزمایشی مختلف کمک نماید. یکی از معمولی ترین روش های آماری که کمک بسیاری به آنالیز ژل های الکتروفورز دو بعدی می کند آنالیز مولفه اصلی((PCA)Principal components analysis) است. در این مطالعه فرآیند تمایز سلول های بنیادی به آستروسیت ها مورد بررسی پروتئومیکی قرار گرفت و...

متن کامل

اثر بربرین در تنظیم آستروسیتهای Gfap+ ناحیه هیپوکمپ موشهای صحرایی دیابتی شده با استرپتوزوتوسین

Background: Diabetes mellitus increases the risk of central nervous system (CNS) disorders such as stroke, seizures, dementia, and cognitive impairment. Berberine, a natural isoquinolne alkaloid, is reported to exhibit beneficial effect in various neurodegenerative and neuropsychiatric disorders. Moreover astrocytes are proving critical for normal CNS function, and alterations in their activity...

متن کامل

اثر بربرین در تنظیم آستروسیتهای Gfap+ ناحیه هیپوکمپ موشهای صحرایی دیابتی شده با استرپتوزوتوسین

Background: Diabetes mellitus increases the risk of central nervous system (CNS) disorders such as stroke, seizures, dementia, and cognitive impairment. Berberine, a natural isoquinolne alkaloid, is reported to exhibit beneficial effect in various neurodegenerative and neuropsychiatric disorders. Moreover astrocytes are proving critical for normal CNS function, and alterations in their activity...

متن کامل

به کارگیری سامانه تبدیل گفتار به متن در حوزه مراقبت سلامت: مزایا، محدودیت‌ها، راهکارها

 Background and Aim: The applicability of any technology to enter a certain field is determined by defining the advantages and disadvantages of the system in that field. The aim of this study is to show the advantages and limitations of using speech recognition systems in health care and providing practical solutions to improve the acceptability of the system in that field. Materials and M...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی امیرکبیر(پلی تکنیک تهران) - دانشکده مهندسی

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023